MaxQ相关论文
在输电线路的设计中,使用三维数字化设计技术可以显著提升地形的划分精度,然而地形划分精度的提升会使得地形栅格矩阵维度呈指数级......
分层强化学习方法可用于解决维数灾难问题,MAXQ方法通过分层地分解值函效,将任务分解为不同层次上的子任务,从而只需在低维空间中......
详细介绍了由Intergrated Products和Dallas Semiconductor合作设计的微控制器MAXQ的指令系统的指令格式和特点及其主要硬件资源的......
强化学习是机器学习领域的一个重要分支,但在强化学习系统中,学习的数量会随着状态变量的个数成指数级增长,从而形成“维数灾”。为此......
提出一种集成Option和MAXQ的分层强化学习新方法———OMQ,该方法以MAXQ为基本框架利用先验知识对任务进行人工分层和在线学习,集......
随着计算机网络技术的发展,Web应用已经渗透到社会的各个应用领域。在市场需求推动下,Web应用的规模越来越大,结构也变得越来越复......
对于较大规模的多智能体决策规划问题,用传统的基于Markov决策过程的方法一般很难解决。本文研究完全分布式控制方式、存在部分感......